Exploration adaptative de graphes sous contrainte de budget

نویسندگان

  • Georges Gouriten
  • Silviu Maniu
  • Pierre Senellart
چکیده

Nous nous intéressons dans cet article à l’exploration d’un graphe tel celui du Web ou d’un réseau social dans un contexte où les nœuds (et les arêtes qui en sont issues) sont découverts un à un, et où le nombre total de nœuds que l’on peut explorer est contraint. Le but est d’optimiser un score global du sous-graphe découvert, fonction monotone de scores élémentaires sur chaque nœud. Ce problème se pose en particulier quand on souhaite collecter les pages du Web correspondant à un sujet donné ou quand on utilise l’API du site d’un réseau social tel Twitter pour constituer un jeu de données centré sur d’un thème. Nous présentons une abstraction de ce problème faisant appel à deux composants principaux : une stratégie d’exploration et un estimateur du score des nœuds de la frontière du graphe. Nous montrons qu’une stratégie gloutonne est suffisante en pratique, et qu’il est possible de s’adapter aux caractéristiques de différents graphes en utilisant des estimateurs qui apprennent automatiquement les caractéristiques prédisant le mieux les scores des nœuds. Ces techniques sont appliquées à des des graphes réels issus de Wikipedia ou de Twitter.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Granularité des motifs de co-variations dans des graphes attribués dynamiques

Résumé. Découvrir des connaissances dans des graphes qui sont dynamiques et dont les sommets sont attribués est de plus en plus étudié, par exemple dans le contexte de l’analyse d’interactions sociales. Il est souvent possible d’expliciter des hiérarchies sur les attributs permettant de formaliser des connaissances a priori sur les descriptions des sommets. Nous proposons d’étendre des techniqu...

متن کامل

Recherche adaptative de structures de régulation génétique

Résumé. Nous avons proposé un algorithme original de Fouille de Données, LICORN, afin d’inférer des relations de régulation coopérative à partir de données d’expression. LICORN donne de bons résultats s’il est appliqué à des données de levure, mais le passage à l’échelle sur des données plus complexes (e.g., humaines) est difficile. Dans cet article, nous proposons une extension de LICORN afin ...

متن کامل

Budget Constrained Resource Allocation for Non-Deterministic Workflows on a IaaS Cloud

Many scienti c applications are described through work ow structures. Due to the increasing level of parallelism o ered by modern computing infrastructures, work ow applications now have to be composed not only of sequential programs, but also of parallel ones. Cloud platforms bring on-demand resource provisioning and pay-as-you-go payment charging. Then the execution of a work ow corresponds t...

متن کامل

Budget Constrained Resource Allocation for Non-deterministic Workflows on an IaaS Cloud

Many scienti c applications are described through work ow structures. Due to the increasing level of parallelism o ered by modern computing infrastructures, work ow applications now have to be composed not only of sequential programs, but also of parallel ones. Cloud platforms bring on-demand resource provisioning and pay-as-you-go payment charging. Then the execution of a work ow corresponds t...

متن کامل

XEWGraph : Outil de Visualisation et Analyse des Hypergraphes pour un Système d'Intelligence Economique

L’Intelligence Economique (ou Competitive Intelligence) est une démarche et un processus organisationnel qui permet à l’entreprise d’être plus compétitive, d’une part en surveillant l’environnement et ses changements, et d’autre part, en surveillant les changements internes. Les graphes sont parmi les outils les plus puissants de visualisation. Ils permettent d’afficher, tout type d’information...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2013